2026-01-17

Dataset

Informazioni

Per questo progetto analizzeremo il sistema nervoso del C. elegans utilizzando tre file distinti provenienti dalla repository OpenWorm.

Tipologia di dati

  • Il Dataset Topologico: Connectome.csv

    • Questo è il file principale (Core Dataset) e rappresenta la Lista degli Archi (Edge List) della rete neurale.
  • Il Dataset di Input: Sensory.csv

  • Questo dataset funge da Tabella degli Attributi dei Nodi per l’input. Identifica quali neuroni agiscono come recettori dell’ambiente esterno.

  • Il Dataset di Output: Neurons_to_Muscles.csv

    • Questo dataset descrive l’interfaccia tra il sistema nervoso e il sistema muscolare.

Informazioni Principali

  • Neuron (Source): Il neurone di partenza (Presinaptico).
  • Target (Target): Il neurone di arrivo (Postsinaptico).
  • Number of Connections (Weight): Il numero di sinapsi fisiche rilevate tra i due neuroni.
  • Neurotransmitter (Attribute): Il tipo di neurotrasmettitore (es. exc per eccitatorio, inh per inibitorio).
  • Function: Il tipo di stimolo rilevato.
  • type: tipo di neurone. (Interneurone, Sensoriale….)

Visualizzazione grafo originale

Grafo Originale

Come si può notare ho voluto identificare i nueoroni che sia erano motori (ovvero davano un input al muscolo) che sensoriali (ricevono un stimolo), andando a creare Il tipo “Sensorimotor”. Questo perchè erano presenti in entrambi i file Muscles e Sensory

L’analisi preliminare della topologia ha evidenziato che la rete non è interamente connessa (connected graph), ma presenta una componente principale e alcuni nodi isolati.

Questi nodi isolati fanno parte del sistema nervoso faringeo. Questi 20 neuroni creano un “cervello autonomo” all’interno del verme, facendo si che quest’ultimo abbia un “piccolo computer” solo per gestire la deglutazione.

Il Sistema Somatico (la componente gigante) deve coordinare il movimento di tutto il corpo (complesso, gerarchico). Il Sistema Faringeo (la componente piccola) deve solo gestire il ritmo della deglutizione.

Analisi comparativa Rete Somatica VS Rete Faringea

Analisi

Confronto Densità

La densità del sistema somatico è 0.0198

La densità del sistema faringeo è 0.2237

Il problema è che in questa maniera sto confrontando la densità grezza di una rete di 300 nodi con una di 20. Sarebbe come barare, perché la densità tende naturalmente a scendere all’aumentare della dimensione.

Cosi ho deciso di simulare un campionamento: “Se prendessi a caso un pezzetto di cervello somatico grande quanto la faringe (20 nodi), quanto sarebbe denso?”.

Test Di significatività Transitività

Conclusioni Comparazioni (Transitività, Densità e Avg Path Lenght)

L’analisi topologica comparativa, supportata da test di ricampionamento (Bootstrap, n=1000), ha evidenziato differenze strutturali critiche tra la Componente Gigante (Sistema Somatico) e la componente isolata (Sistema Faringeo), riflettendo le diverse specializzazioni funzionali dei due circuiti.

  • Densità Reale Faringe: 0.2237
  • Densità Media Somatico (Simulato): 0.02
  • Z-Score: 20.08
  • P-Value: 0
    • Densità (Connettività Locale): Posso concludere che nonostante la dipendenza della densità dalla dimensione della rete (\(N\)), il test di permutazione (n=1000) conferma che l’alta densità del sistema faringeo è una proprietà topologica intrinseca e statisticamente significativa (\(p < 0.001, Z-score > 3\)), e non un mero artefatto di scala. ideale per attivare massivamente e simultaneamente i muscoli della deglutizione (comportamento “tutto o niente”).
  • Path Length Faringe: 2.797
  • Path Length Random (Media): 3.412
  • P-Value: 0.5390782
    • Average Path Length (Efficienza Globale): Sebbene il sistema faringeo sia molto efficiente (\(L \approx 2.8\)), la differenza rispetto al tessuto somatico casuale non è statisticamente significativa (P \(\approx\) 0.54). L’evoluzione ha ottimizzato l’intero cervello per minimizzare la distanza di comunicazione, indipendentemente dal modulo funzionale considerato.
  • Transitività Faringe (Reale): 0.3976
  • Transitività Random (Media): 0.1003
  • Z-Score: 1.49
  • P-Value: 0.091
    • Transitività (Robustezza e Ridondanza): Il sistema faringeo presenta un coefficiente di clustering circa 4 volte superiore al caso (\(0.40\) vs \(0.10\)). Sebbene il p-value sia marginale (P \(\approx\) 0.09) a causa dell’alta varianza campionaria su reti piccole, l’Effect Size è marcato. il sistema faringeo tende a organizzarsi in clique e triangoli chiusi.

Analisi Rete Somatica

Analisi Distribuzioni dei gradi

L’analisi visiva delle tre metriche di centralità

  • Out-Degree (Broadcasting / Divergenza):
    • Significato Questi nodi agiscono come Broadcasters. Il loro compito è trasdurre uno stimolo ambientale (es. un tocco sul naso) e disseminare l’informazione (“urlarla”) verso il maggior numero possibile di nodi.
  • In-Degree (Integrazione / Convergenza):
    • Significato Questi nodi fungono da Integratori. Per eseguire un’azione critica come la contrazione muscolare, non possono affidarsi a un singolo input; necessitano di ricevere “l’ordine finale” convergente da molteplici nodi.
  • Total Degree (Hub Centrali / Routing):
    • Significato Questi nodi rappresentano il nucleo computazionale (“Core”) della rete. Possiedono un Alto In-Degree e Out-Degree
Grado Medio per Ruolo Funzionale
role N_Neuroni Avg_Out_Degree Avg_In_Degree
Interneuron 88 11.38 11.74
Sensorimotor 13 10.92 4.62
Motor 105 9.09 7.74
Sensory 73 8.85 3.95
Muscle 94 0.00 5.84

L’analisi quantitativa dei gradi medi per categoria rivela il flusso dettagliato dell’informazione:

  1. Origine (Sensory): I neuroni sensoriali mostrano un chiaro sbilanciamento verso l’output (\(K_{out} \approx 8.8\) vs \(K_{in} \approx 3.9\)), confermando il loro ruolo di broadcasters primari.
  2. Elaborazione (Interneuron): Mantengono un bilanciamento quasi perfetto (\(K_{out} \approx 11.4\) vs \(K_{in} \approx 11.7\)), agendo come hub di ricircolo e integrazione.
  3. Amplificazione (Motor): I motoneuroni mostrano un Out-Degree superiore all’In-Degree (\(9.09 > 7.74\)). Questo riflette la loro funzione di divergenza sinaptica verso i muscoli: un singolo neurone motorio deve innervare molteplici cellule muscolari per coordinare la contrazione.
  4. Destinazione (Muscle): I nodi muscolari rappresentano i veri “Sinks” della rete, con un In-Degree netto (~5.8) e un Out-Degree nullo (0.00), segnando la fine del flusso informativo topologico.

Analisi Power Law e esponenziale della distribuzione dei gradi

Power-Law vs Distribuzione Esponenziale

L’analisi della distribuzione dei gradi confronta due modelli teorici fondamentali per descrivere la topologia della rete

Ho usato Xmin, per dire di Ignorare la massa di nodi piccoli e normali che confondono i calcoli, e partire da dove inizia il comportamento speciale degli HUB (\(x_{min}=21\)).

Conclusioni:

La rete sfrutta i vantaggi degli Hub per l’efficienza comunicativa (zona scale-free), ma subisce un taglio netto nella coda estrema imposto dai limiti biofisici dell’organismo (componente esponenziale). la rete “vorrebbe” essere Scale-Free, ma viene frenata.

Alla luce dei dati (\(\alpha \approx 3.8\), \(\lambda \approx 0.09\)), possiamo concludere che la rete del C. elegans non ricade perfettamente in nessuno dei due modelli estremi, ma presenta caratteristiche ibride tipiche delle reti biologiche fisiche, Truncated Power-Law. il parametro Alpha spinge i nodi a diventare Super HUB, fino a quando la componente esponenziale agisce come freno.

POWER LAW: L’esponente \(\alpha\) elevato (3.8) indica che la formazione di ‘Super-Hub’ è molto più rara rispetto a una rete Scale-Free teorica.

ESPONENZIALE: Il valore di \(\lambda\) (0.09) suggerisce che i costi fisici e metabolici di cablaggio agiscono come un fattore limitante (“cutoff”), impedendo ai neuroni di accumulare un numero infinito di connessioni.

Ci sono HUB per garantire l’efficienza, ma non possono accumulare connessioni all’infinito per via dell’organismo.

ramite il criterio AIC abbiamo stabilito che la power LAW è quella che fittà meglio (AIC PIU BASSO)

Assortività

Analisi Assortività

  • ANALISI RICH CLUB (Top 15 Nodi)
    • Densità Globale della Rete: 0.0198
    • Densità Interna dei Top 15: 0.3429
    • Rich Club Ratio: 17.34 x

Conlcusioni analisi Assortatività

Il calcolo del coefficiente di assortatività per grado restituisce un valore di \(r \approx 0.0275\). Sebbene questo valore sia numericamente prossimo allo zero (suggerendo neutralità), nel contesto specifico del connettoma di C. elegans esso riflette un bilanciamento tra due tendenze topologiche opposte:

  1. Tendenza Disassortativa (Controllo): La struttura a stella tipica delle reti biologiche, dove pochi hub centrali coordinano molti nodi a basso grado, esercita una pressione verso valori negativi.
  2. Tendenza Assortativa (Core Integrativo): La presenza evidenziata in precedenza di un forte “Rich Club” di interneuroni che sono densamente interconnessi tra loro, esercita una pressione verso valori positivi.

Conclusione: Il valore neutro non indica casualità, ma rivela che il sistema somatico opera con una Architettura Ibrida: possiede un nucleo centrale denso e collaborativo (Assortativo) che collettivamente gestisce una periferia gerarchica (Disassortativa).

Analisi Betwenness Centrality

Mappa Centralità Somatica

Un ulteriore domanda a cui volevo darmi una risposta dati i risultati precedenti è la seguente: “I neuroni più connessi (Degree) sono gli stessi che controllano il flusso di informazioni (Betweenness)? O sono diversi?”

Correlazione Degree e Betweenness

  • Risultati Quantitativi:
    • Correlazione di Spearman: 0.896 (Valore molto alto indica forte sovrapposizione).
    • Overlap dei Top 10: Il 50% dei nodi presenti nella top 10 per grado sono presenti anche nella top 10 per betweenness.

i centri di comando integrano le informazioni (funzione Hub) e agiscono contemporaneamente come autostrade obbligate per il segnale (funzione Bridge). Cosi facendo la rete riesce a massimizzare la velocità di trasmissione ma concentra la vulnerabilità in pochi nodi specifici.

Analisi delle 4 centralità per Neurone

Analisi delle 4 centralità

Analisi delle Centralità nella Rete Neurale di C. elegans

La figura mostra la distribuzione delle quattro principali misure di centralità (Betweenness, Closeness, Degree e PageRank) calcolate per ciascun ruolo neuronale (Interneuron, Motor, Muscle, Sensorimotor, Sensory).

Dall’analisi emerge una chiara organizzazione gerarchica della rete. Gli interneuroni presentano valori mediamente più elevati di Betweenness e Degree, indicando un ruolo centrale nei percorsi di comunicazione e una maggiore connettività rispetto agli altri neuroni.

La Closeness centrality risulta più alta e omogenea per interneuroni e sensorimotori, evidenziando un accesso più rapido e diretto al resto della rete. I neuroni muscle, invece, mostrano valori inferiori in quasi tutte le metriche, coerentemente con la loro posizione periferica e funzione terminale nella trasmissione del segnale.

La PageRank centrality rivela che, pur non essendo altamente connessi, i neuroni motor e muscle mantengono un’importanza funzionale elevata, poiché ricevono input da nodi centrali e influenti.

Analisi Del “Chi Parla con Chi”

Matrice delle comunicazioni

Analisi della Matrice di Densità delle Connessioni

I neuroni Sensorimotor (\(\approx 7.1\%\)) e gli Interneuroni (\(\approx 6.4\%\)) mostrano la massima densità di connessioni interne. Questo indica che l’elaborazione del segnale avviene primariamente all’interno di questi gruppi funzionali prima di essere trasmessa altrove.

La bassissima densità di connessioni dirette Sensory \(\to\) Motor (\(\approx 1.5\%\)) dimostra che il sistema inibisce i riflessi diretti non mediati. L’input sensoriale grezzo deve essere processato dagli strati intermedi.

Il flusso preferenziale Sensory \(\to\) Interneurons (\(5.6\%\)) valida il modello classico di computazione sequenziale

Nel complesso, lo schema di densità delle connessioni evidenzia una struttura direzionale e gerarchica della rete: neuroni sensoriali, integrati da interneuroni e sensorimotori, e infine trasmessi ai motoneuroni che controllano i muscoli.

Analisi della connettività con l’investimento sinaptico

Spiegazione

Il grafico evidenzia una legge di proporzionalità diretta (relazione quasi lineare in scala log-log) tra il numero di partner (Degree) e la forza sinaptica totale (Strength).

Consolidamento del Core (Sopra la Linea): I Motoneuroni mostrano un “peso medio per link” superiore alla norma. Il sistema nervoso investe metabolicamente su di loro creando connessioni fisicamente robuste (molte sinapsi per singolo contatto) per garantire un’alta affidabilità nella trasmissione dei comandi motori.

Analisi Clustering

Clustering

Un ulteriore domanda che mi sono posto è come la rete somatica si divide in comunità

Bar Plot modularità

Rappresentazione visiva dei cluster (louvian)

Analisi Cluster diretto (Infomap)

(Anatomia - Louvain): I neuroni sono raggruppati perché sono vicini. gruppi compatti.

(Fisiologia - Infomap): Mostra i Processi. I neuroni sono raggruppati perché si parlano. gruppi “allungati” o mescolati, perché seguono la strada del segnale (Sensore -> Interneurone).

Rappresentazion 3D cluster

Dopodichè sono andato ad analizzare se i cluster erano rappresnetativi anche tenendo conto della posizione spaziale

Collegamenti spaziali (Distance Decay)

Analisi Collegamenti spaziali

Un ulteriore domanda che mi sono posto è la seguente: i neuroni connessi sono fisicamente vicini? La maggior parte degli archi è corta o ci sono molti archi lunghi, e come cambia la proabilità di connetettersi all’aumentare della distanza?

  • il Principio del “Wiring Economy” (Risparmio Energetico):
    • Dominio delle connessioni corte: La distribuzione delle lunghezze degli archi è fortemente asimmetrica a destra. La maggior parte delle sinapsi è cortissima per minimizzare il volume assonale e il costo metabolico.
    • L’Eccezione Funzionale (Long-Tail): Esiste una “coda lunga” di connessioni rare e costose a lungo raggio. Queste sono biologicamente essenziali per garantire la comunicazione diretta tra estremità distanti (es. circuiti testa-coda per il movimento).
  • L’Effetto “Distance Decay” (Decadimento Spaziale):
    • La regola della vicinanza: La probabilità di connessione (\(P(d)\)) crolla all’aumentare della distanza fisica.
    • Quantificazione dell’impatto:
      • Baseline Casuale: Due neuroni presi a caso hanno solo il ~1.98% di probabilità di essere connessi.
      • Vicinanza Fisica: Se due neuroni sono vicini, la probabilità sale al ~10%.
      • Fattore Moltiplicativo: La prossimità fisica aumenta la probabilità di connessione di 5-6 volte rispetto alla media globale.
    • Il picco distale: Nonostante il decadimento generale, la probabilità tende a risalire per le distanze massime, confermando la necessità strutturale di collegare gli estremi dell’organismo.
  • L’Analogia: Le connessioni neuronali seguono la logica delle amicizie umane: ho moltissimi amici nel mio quartiere (basso costo, alta probabilità) e pochissimi in Australia (alto costo, bassa probabilità). La distanza fisica è il principale filtro delle interazioni.

Analisi Small World

La rete è small world?

  • ANALISI SMALL-WORLD (Watts-Strogatz)
    • Clustering Reale: 0.2007 | Clustering Casuale: 0.0392 | Gamma: 5.13 (Target: >> 1)
    • Cammino Medio Reale: 4.8907 | Cammino Medio Casuale: 3.1856 | Lambda: 1.54 (Target: ≈ 1)
    • Rapporto C/L: 0.041
    • INDICE SIGMA: 3.3386

Il confronto che è stato eseguito con i modelli nulli (Grafi Casuali di Erdos-Renyi) ha permesso di classificare l’architettura della rete.

Metriche di Watts-Strogatz * Clustering (\(C \gg C_{rand}\)): La rete mostra un coefficiente di clustering enormemente superiore al caso indicando una specializzazione locale estrema.

  • Path Length (\(L \approx L_{rand}\)): La lunghezza media dei cammini è comparabile, seppur leggermente superiore, a quella casuale.

  • Indice Sigma (\(\sigma \gg 1\)): Con un valore di \(\sigma > 1\), la rete è classificata teoricamente come Small-World.

Il rapporto diretto \(C/L \approx 0.041\) è inferiore ai modelli teorici ideali. Questo non indica inefficienza, ma riflette il vincolo morfologico: il fatto che’organismo impone un limite fisico alla minimizzazione del cammino medio (\(L\)) è dovuto al motivo che i neuroni sono cellule fisiche con cavi che occupano spazio e consumano energia per essere costruiti e mantenuti, che la rete compensa massimizzando l’efficienza locale (\(C\)).

In conclusione la rete preferisci collegamenti corti e locali e usa solo pochi collegamenti lunghi costosi. Questo la rende una small world accettabile, ma non perfetta

Max K-Core vs Rich Club e Correlazioni (Hub/Auth vs Degree)

Analisi

Un ulteriore analisi che sono andato ad eseguire è stata quella di confrontare la Shell più profonda (Cricca) con i neuroni che hanno tanti contatti, per vedere se c’è sovrapposizione.

Analisi Topologica dei Top 15 Hub: Core vs Connector
Neurone Grado Totale K-Shell Index Ruolo Interpretazione
AVAR 98 12 CORE HUB Membro dell’Elite (Rich + Core)
AVAL 90 12 CORE HUB Membro dell’Elite (Rich + Core)
AVBL 60 12 CORE HUB Membro dell’Elite (Rich + Core)
PVCL 59 12 CORE HUB Membro dell’Elite (Rich + Core)
PVCR 58 12 CORE HUB Membro dell’Elite (Rich + Core)
AVDR 57 12 CORE HUB Membro dell’Elite (Rich + Core)
DVA 54 11 bridge CONNECTOR Ponte verso la Periferia
AVBR 53 12 CORE HUB Membro dell’Elite (Rich + Core)
AVEL 52 12 CORE HUB Membro dell’Elite (Rich + Core)
AVER 51 11 bridge CONNECTOR Ponte verso la Periferia
AVDL 46 12 CORE HUB Membro dell’Elite (Rich + Core)
RIAR 44 11 bridge CONNECTOR Ponte verso la Periferia
RIAL 42 11 bridge CONNECTOR Ponte verso la Periferia
HSNR 41 12 CORE HUB Membro dell’Elite (Rich + Core)
RIMR 38 11 bridge CONNECTOR Ponte verso la Periferia

Analizzando la tabella possiamo notare che su 21 neuroni appartenenti al Max K-shell (12) 10 di questi appartengono al rich club, sui 15 totali.

La maggioranza degli hubs risiede nel max K-Core, quasi il 66%.

Ma l’analisi più interessante è che la sovrapposizione non è completa. 5 dei 15 neuroni appartenti al rich club non fanno parte della Max K-shell. Questi nodi si possono interpetare come dei ponti verso l’esterno del sistema (come ad esempio trasferire un input al muscolo).

Inoltre 11 dei neuroni presenti all’interno del max core non sono top hubs, questo implica che pur avendo un numero moderato di connessioni, garantiscono la resilienza del nucleo pure se gli hub venissero rimossi.

Grafico rappresentativo del Max Core e Overlap Rich-Club

Dal grafico emergono diverse analisi interessanti, la più interessante è quella che prende in considerazione i deep connectors

  • Deep Connectors (La “Colla” del Nucleo) : I nodi in azzurro (sinistra, sopra la linea tratteggiata) sono la componente strutturale più interessante. Pur non essendo “famosi” in termini di grado (hanno meno di 28 connessioni), risiedono nel guscio massimo (\(K=12\)). Questi neuroni agiscono come “connettori profondi”, garantendo la coesione interna del nucleo e impedendone la frammentazione qualora gli Hub principali venissero rimossi.

Correlazioni e Analisi Hub e Authority

Correlazioni e Analisi Hub e Authority

il grafico Authority vs Hub Score, rappresenta esattemente un sistema biologico. i nodi in alto a destra hanno punteggi altri su entrambi gli assi, ovvero che ricevono informazioni (Authority), le elaborano e le ritrasmettono (Hub). Non sono specializzati, gestiscono l’intero flusso di informazioni Altri nodi sono sbilanciati verso uno dei due assi, indicando una specializzazione (solo ricevitori o solo trasmettitori).

il prestigio (PageRank) è dettato dalla popolarità (In-Degree), con una correlazione molto alta (0.901), Sono i terminali decisionali del sistema.

Analisi di Resilienza con diverse strategie

Resilienza agli attacchi

Come il grafico evidenza la rete è resiliente riguardo i guasti, lo si può dedurre dal fatto che la strategia casuale è la peggiore delle strategie presenti. Dall’altro canto la rete somatica è molto sensibile agli attacchi mirati, questa caratteristica è dovuta alla presenza di super hub, infatti la rimozione per grado e PageRank sono risultate le strategie più efficaci.

Questo conferma il fatto che la rete è scale free, soggetta a vincoli fisici. il fatto che attaccando la rete a caso, il sistema non collassa. Questo indica la robustezza della rete. Al contrario la fragilità della rete è data dagli attacchi mirati, se si attacca una piccola frazione di nodi specificie, e li elimini, il sistema muore.

é importante sottolineare come l’attaco basato sulla degree statica (non la ricalcoliamo sempre) è già sorpendetemente efficace. Gli hub sono già noti dall’inizio

Conclusioni

Conclusioni

L’analisi della rete somatica del verme C ELEGANS ha messo in luce moltepici aspeti significativi caratteristici di una rete complessa

  • La rete è scale free vincolata fisicamente, supportando il fallimento dei nodi, mostrando la resilienza dei nodi.
  • La rete è orientata alla creazione di Hub (Power Law), ma è vincolata alla creazione di quest’ultimi per limiit fisici (cut-off esponenziale)
  • La rete mostra significative proprietà Small-World, quindi con Cammino Medio breve(soggetto a vincoli fisici) + Clustering alto.
  • La formazione di comunità rispetto alla fisica reale del verme
  • La probabilità che due neuroni siano connessi (\(P(d)\)) decade monotonicamente all’aumentare della loro distanza fisica.